C-CUBE: Un nouvel opérateur d'agrégation pour les entrepôts de données en colonnes

نویسندگان

  • Khaled Dehdouh
  • Fadila Bentayeb
  • Nadia Kabachi
  • Omar Boussaïd
چکیده

RÉSUMÉ. Les bases de données orientées colonnes offrent au domaine décisionnel le modèle le plus approprié au stockage des entrepôts de données. Cependant, en l’absence d’opérateurs d’analyse en ligne, le seul moyen, très coûteux, qui existe pour construire des cubes OLAP consiste à utiliser l’opérateur UNION sur des requêtes de regroupement afin d’obtenir l’ensemble des Group By nécessaires au calcul de cube OLAP1. Pour pallier ce problème, nous proposons dans cet article un nouvel opérateur d’agrégation, baptisé CCUBE (Columnar-CUBE), qui permet de calculer des cubes de données à partir d’entrepôts de données stockés en colonnes. Nous avons implémenté l’opérateur C-CUBE au sein du SGBD orienté colonnes MonetDB et réalisé des expérimentations sur le benchmark SSBM 2 (Star Schema Benchmark). Nous avons ainsi pu montrer que C-CUBE présente des temps de calcul de cubes OLAP jusqu’à 70% moins élevés comparés à l’opérateur CUBE d’Oracle sur un entrepôt de 1To. ABSTRACT. Columnar databases are suitable for data warehouses and multidimensional data structures storage. However, Columnar DBMS have not an appropriate operator for calculating OLAP cubes. In this paper, we propose a new OLAP operator for columnar DBMS, C-CUBE, that allows to calculate OLAP data cubes from columnar oriented-data warehouses. We have then implemented C-CUBE under MonetDB DBMS and curried out some experimentations onto Star Schema Benchmark. The obtained results show that CCUBE improve the computation time of data cubes up to 70% compared to Oracle CUBE operator.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

TLabel: Nouvel opérateur d'agrégation par catégorisation dans les cubes de textes

Résumé. L’analyse en ligne (OLAP) dans les cubes de textes nécessite la définition de nouveaux types d’opérateurs d’analyse appropriés aux données textuelles. En effet, les opérateurs d’agrégation classiques ont montré leur efficacité pour l’analyse en ligne des données numériques, mais ils sont inadaptés pour l’analyse des données textuelles. Dans cet article, nous proposons un nouvel opérateu...

متن کامل

Analyse en ligne d'objets complexes avec l'analyse factorielle

Résumé. Les entrepôts de données et l’analyse en ligne OLAP (On-line Analysis Processing) présentent des solutions reconnues et efficaces pour le processus d’aide à la décision. Notamment l’analyse en ligne, grâce aux opérateurs OLAP, permet de naviguer et de visualiser des données représentées dans un cube multidimensionnel. Mais lorsque les données ou les objets à analyser sont complexes, il ...

متن کامل

Modèles d'arbre pour XOLAP

Résumé. Avec l’avènement de XML comme standard de représentation de données décisionnelles, les entrepôts de données XML trouvent leur place dans le développement de solutions décisionnelles. Dans ce contexte, il devient nécessaire de permettre des analyses OLAP sur des cubes de données XML. Afin de contribuer à ces recherches, de définir un cadre formel et de permettre l’optimisation indispens...

متن کامل

Analyse multigraduelle OLAP

Résumé. Les systèmes décisionnels reposent sur des bases de données multidimensionnelles qui offrent un cadre adéquat aux analyses OLAP. L’article présente un nouvel opérateur OLAP nommé « BLEND » rendant possible des analyses multigraduelles. Il s'agit de transformer la structuration multidimensionnelle lors des interrogations pour analyser les mesures selon des niveaux de granularité différen...

متن کامل

Un index de jointure pour les entrepôts des données XML

Résumé. Les entrepôts de données XML proposent une base intéressante pour les applications décisionnelles qui exploitent des données hétérogènes et provenant de sources multiples. Cependant, les performances des SGBD natifs XML étant actuellement limitées, il est nécessaire de trouver des moyens de les optimiser. Dans cet article, nous proposons un nouvel index spécifiquement adapté à l’archite...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2014